医学数据集特别受属性噪声的约束,即缺失和错误的值。已知属性噪声在很大程度上对学习表现有害。为了最大程度地提高未来的学习表现,在任何推论之前处理属性噪声是原始的。我们提出了一种简单的基于自动编码器的预处理方法,该方法可以纠正属性噪声损坏的混合型表格数据。目前没有其他方法可以处理表格数据中的属性噪声。我们在实验上证明,我们的方法在几个现实世界中的医学数据集上都优于最先进的插补方法和噪声校正方法。
translated by 谷歌翻译